日拱一卒 | 如何评估语料库建设的平衡性与代表性?
第55次外研社国际汉语知识测验
绝密
★
启用前
考场规则
1
考生必须携带手机进入考场,答题过程中请随意交头接耳、左顾右盼,条件允许可与邻座尽情讨论;
2
答题完毕后请下滑至文末点击“赞”“在看”,并在评论区签退。
在语料库语言学中,语言研究的直接对象是语言运用。只有通过对语言运用实例大量全面的收集和分析,才能得到语言典型特征的可靠依据,建设一个能全面反映某一语言全部语言事实的平衡语料库。从另一个角度来说,即考虑语料库的抽样原则如何保证样本分布均衡,从而使新建语料库尽可能具有代表性。那么在实际的语料库建设过程中,可以通过哪些指标评估语料库建设的平衡性与代表性?
点击空白处查看
答案及完整解析
—
ABCDEF
解析:一般来说,语料库的平衡型和代表性应该充分考虑以下几个方面:规模、语体、时间与空间、流通度。
规模即语料的量。语料的量影响语言整体特征的可靠描述。
语体即书面语和口语问题。对于语料库,书面语和口语体现出来的统计特征大不相同。
时间与空间,即历时与共时。共时状态是语言的空间态,历时状态是语言的时间态,从时间与空间的双重状态来观察分析,才是全方位的。
流通度,即人们对一种语言现象的流行通用程度的感觉,也就是所谓的“语感”。流通程度高、听得多,就觉得能说,否则,就觉得不能说。
前面提到的语体、时空观念是语料平衡的大原则,具体来说,我们还可以把流通度理论作为语料平衡的细则。其中主题是主轴,主要通过人们对事物的关注程度来反映语言的实际流通情况,如时事热点、文体教育、生活休闲、财经经济等;媒体是副轴,主要通过读者对语言直接载体的接受程度来反映语言的实际流通情况,如报纸杂志、通俗小说、学术刊物等;文体也是副轴,主要通过文本或话语表达方式的分布程度来反映语言的实际流通情况,如记叙文体、论说和描写文体、说明文体等。
内容来源:
(刘华,外研社,2020)
今日互动
在你的学习和研究中,曾经使用过哪些语料库?你是否使用过工具自建语料库?欢迎在评论区留言讨论,华丽签退~
推荐资源
《语料库语言学——
理论、工具与案例》图书
(刘华,外研社,2020)
《语料库语言学——理论、工具与案例》是“语言计算与智能汉语教学”系列图书的第一卷。本书分为三大部分:理论篇、工具篇与案例篇,主要介绍了语料库语言学的基本概念、建设原则和加工内容,运用“汉语助研”软件对语料进行建库、检索和统计的方法,以及相应的语料库统计和分析的具体案例等内容。全书理论与实践相结合,内容翔实、通俗易懂,为广大读者提供了非常实用的语料库语言学方面的工具、方法和真实案例的介绍,能很好地满足汉语研究者对于语料库语言学的学习需求。
左右滑动查看目录及样张
“语料库语言学——
研究方法、工具与案例”专题课程
点击图片了解详情
为帮助大家掌握国际中文教育及相关研究领域语料库语言学的研究方法,更高效地利用语料库语言学的研究原理与工具助力语言研究,暨南大学博士生导师、“语言计算与智能汉语教学”系列图书作者刘华教授开设了以“语料库语言学——研究方法、工具与案例”为主题的课程,刘老师围绕语料库语言学的基本研究方法、研究范式、研究工具及操作流程、研究案例分析等展开,通过系列课程为大家全面拆解语料库语言学,助力大家更高效地开展语言研究,扫码即可参与学习哦~
扫码报名
(含1节免费试听课)
往期精选
尤易 曹贤文 | 20 年来国内外学习者语料库建设及应用研究分析
推荐资源丨外研社国际中文教师发展系列课程(第四辑)重磅上线!
编辑|吴晓静
图文编辑|何纯洁(实习)
原创稿件,转载请注明来自微信订阅号:外研社国际汉语
欢迎分享与转发
关注我们
微信公众号
教学资源网
直录播课程
点击“阅读原文”查看更多精彩内容